OpenAI,Responses API,AI Agent,Shell工具
从模型到智能体:OpenAI Responses API 计算机环境完整解析
AI 搜索 • ai_insider 发表了文章 • 0 个评论 • 35 次浏览 • 2 小时前
编者按:随着 AI 从单一任务执行者向复杂工作流处理者演进,OpenAI 最新推出的 Responses API 计算机环境为开发者提供了构建生产级智能体的完整基础设施。本文深入解析其架构设计与核心机制。引言:AI 范式的转变
我们正处于 AI 使用的重大转折点——从擅长特定任务的模型向能够处理复杂工作流的智能体(Agent)转变。
传统上,通过提示词(Prompting)只能访问模型训练时获得的智能。然而,当给模型配备一个计算机环境后,它能实现更广泛的用例:运行服务、从 API 请求数据、生成电子表格或报告等更有用的产物。
但在构建智能体时,开发者面临诸多实际问题:
- 中间文件存放在哪里?
- 如何避免将大表格粘贴到提示词中?
- 如何在不造成安全噩梦的情况下给工作流提供网络访问?
- 如何处理超时和重试,而无需自己构建工作流系统?
- 组装上下文:用户提示词 + 历史对话状态 + 工具指令
- 模型决策:决定下一步动作(如选择 Shell 执行)
- 命令转发:Responses API 服务将命令转发到容器运行时
- 流式输出:Shell 输出流式返回,并反馈到下一次请求的上下文
- 结果检查:模型检查结果,发出后续命令或生成最终答案
- 循环直到完成
Codex 就依赖这一机制来维持长时间运行的编码任务和迭代工具执行,而不会降低质量。容器上下文:状态与资源管理 容器不仅是运行命令的地方,也是模型的工作上下文。在容器内部,模型可以读取文件、查询数据库、在网络安全策略控制下访问外部系统。网络安全访问 网络访问是智能体工作负载的重要组成部分,但给容器无限制的网络访问存在风险。OpenAI 的解决方案是 Sidecar Egress 代理: 所有出站网络请求流经集中式策略层,强制执行允许列表(Allowlist)、实施访问控制、保持流量可观察。Agent Skills:可复用的工作流构建块 Shell 命令很强大,但许多任务重复相同的多步骤模式。Agent Skills 将这些模式打包成可复用、可组合的工作流构建块。 一个 Skill 是一个文件夹包,包含 SKILL.md(元数据和指令)以及支持资源(API 规范、UI 资产等)。结语OpenAI 的最新模型经过训练,能够分析先前的对话状态,并生成一个压缩项(Compaction Item),以加密的、token 高效的形式保留关键先前状态。
Responses API 计算机环境的推出,标志着 AI 从"对话工具"向"行动智能体"的关键转变。对于搜索和 AI 领域的从业者而言,这一架构设计提供了宝贵的参考:如何将大模型的推理能力与可靠的执行环境相结合,打造真正有用的自动化系统。 原文来源:OpenAI Engineering Blog 作者:Bo Xu, Danny Zhang, Rohit Arunachalam 发布日期:March 11, 2026"语言模型的意义不仅仅是生成文本、图像和音频——我们将继续发展我们的平台,使其更能够大规模处理复杂的真实世界任务。"
从模型到智能体:OpenAI Responses API 计算机环境完整解析
AI 搜索 • ai_insider 发表了文章 • 0 个评论 • 35 次浏览 • 2 小时前
编者按:随着 AI 从单一任务执行者向复杂工作流处理者演进,OpenAI 最新推出的 Responses API 计算机环境为开发者提供了构建生产级智能体的完整基础设施。本文深入解析其架构设计与核心机制。引言:AI 范式的转变
我们正处于 AI 使用的重大转折点——从擅长特定任务的模型向能够处理复杂工作流的智能体(Agent)转变。
传统上,通过提示词(Prompting)只能访问模型训练时获得的智能。然而,当给模型配备一个计算机环境后,它能实现更广泛的用例:运行服务、从 API 请求数据、生成电子表格或报告等更有用的产物。
但在构建智能体时,开发者面临诸多实际问题:
- 中间文件存放在哪里?
- 如何避免将大表格粘贴到提示词中?
- 如何在不造成安全噩梦的情况下给工作流提供网络访问?
- 如何处理超时和重试,而无需自己构建工作流系统?
- 组装上下文:用户提示词 + 历史对话状态 + 工具指令
- 模型决策:决定下一步动作(如选择 Shell 执行)
- 命令转发:Responses API 服务将命令转发到容器运行时
- 流式输出:Shell 输出流式返回,并反馈到下一次请求的上下文
- 结果检查:模型检查结果,发出后续命令或生成最终答案
- 循环直到完成
Codex 就依赖这一机制来维持长时间运行的编码任务和迭代工具执行,而不会降低质量。容器上下文:状态与资源管理 容器不仅是运行命令的地方,也是模型的工作上下文。在容器内部,模型可以读取文件、查询数据库、在网络安全策略控制下访问外部系统。网络安全访问 网络访问是智能体工作负载的重要组成部分,但给容器无限制的网络访问存在风险。OpenAI 的解决方案是 Sidecar Egress 代理: 所有出站网络请求流经集中式策略层,强制执行允许列表(Allowlist)、实施访问控制、保持流量可观察。Agent Skills:可复用的工作流构建块 Shell 命令很强大,但许多任务重复相同的多步骤模式。Agent Skills 将这些模式打包成可复用、可组合的工作流构建块。 一个 Skill 是一个文件夹包,包含 SKILL.md(元数据和指令)以及支持资源(API 规范、UI 资产等)。结语OpenAI 的最新模型经过训练,能够分析先前的对话状态,并生成一个压缩项(Compaction Item),以加密的、token 高效的形式保留关键先前状态。
Responses API 计算机环境的推出,标志着 AI 从"对话工具"向"行动智能体"的关键转变。对于搜索和 AI 领域的从业者而言,这一架构设计提供了宝贵的参考:如何将大模型的推理能力与可靠的执行环境相结合,打造真正有用的自动化系统。 原文来源:OpenAI Engineering Blog 作者:Bo Xu, Danny Zhang, Rohit Arunachalam 发布日期:March 11, 2026"语言模型的意义不仅仅是生成文本、图像和音频——我们将继续发展我们的平台,使其更能够大规模处理复杂的真实世界任务。"